01_Introduccion/03 -- Problema-a-Solucionar.md

El Problema a Solucionar

El conocimiento operacional está disperso y es difícil de consultar

Las organizaciones industriales acumulan, a lo largo del tiempo, un volumen creciente de conocimiento operacional: configuraciones de variables, reglas de negocio, anotaciones sobre entidades del sistema, documentación de procesos y registros históricos.

El problema fundamental es que este conocimiento, aunque exista y esté digitalizado, no es accesible de forma natural. Para responder a una pregunta concreta —¿qué regla controla esta variable?, ¿qué criterios se aplican a este proceso?, ¿dónde está documentado este procedimiento?— un empleado debe navegar manualmente por interfaces especializadas, conocer la estructura del sistema o, en el peor de los casos, preguntar a un compañero. Este coste de acceso a la información tiene un impacto directo sobre la productividad y la capacidad de respuesta de la organización.

Para ello, los sistemas de búsqueda tradicionales basados en palabras clave presentan limitaciones fundamentales en este contexto. Una búsqueda léxica solo recupera documentos que contienen exactamente los términos consultados, sin entender la intención ni el significado de la pregunta.

Si el usuario no conoce la terminología exacta del sistema, o si la información relevante está formulada de forma diferente a como se pregunta, la búsqueda no encuentra nada útil.

Un ejemplo inmediato es el Ctrl+F de cualquier navegador o visor de documentos: si un operario busca "intercambiador de calor" en un manual donde ese componente se llama "HX-03" o "unidad de transferencia térmica", el resultado es vacío, aunque la información esté justo ahí. Exactamente el mismo problema aparece en una consulta SQL sobre una base de datos: WHERE descripcion LIKE '%temperatura%' recupera únicamente las filas que contienen esa palabra exacta, y deja fuera cualquier registro que hable de "calor", "gradiente térmico" o "temp. entrada", aunque semánticamente sean lo mismo.

Además, los buscadores clásicos no sintetizan: presentan una lista de resultados que el usuario debe interpretar y filtrar manualmente. No generan una respuesta directa, no cruzan información de fuentes heterogéneas y no mantienen el contexto de una conversación.


El enfoque RAG como solución

La Recuperación Aumentada por Generación (RAG, Retrieval-Augmented Generation) es un paradigma que combina la búsqueda semántica sobre una base de conocimiento propia con la capacidad de síntesis y razonamiento de un modelo de lenguaje.

A diferencia de la búsqueda léxica, la búsqueda semántica no compara palabras sino significados: entiende que "intercambiador de calor" y "HX-03" pueden referirse al mismo concepto y los recupera conjuntamente. En lugar de depender únicamente del conocimiento preentrenado del modelo —que no incluye los datos internos de la organización—, el sistema recupera los fragmentos de información más relevantes para cada consulta y los proporciona como contexto al modelo, que genera una respuesta coherente y fundamentada. Tanto el funcionamiento de la búsqueda semántica como los detalles del paradigma RAG se desarrollan con mayor profundidad en el capítulo de tecnologías fundamentales.

Aplicado al contexto de DWall, este enfoque permite que los usuarios formulen preguntas en lenguaje natural sobre la operativa de su organización y obtengan respuestas directas, sin necesidad de navegar por interfaces ni conocer la estructura interna del sistema. El conocimiento de la plataforma y de los documentos corporativos pasa a ser consultable de forma conversacional.